on commence avec un point pris au hasard sur la courbe
tant que l'on n'a pas atteint le minimum local :
- on regarde dans quelle direction la dérivée est la plus petite
- on fait un petit pas dans cette direction $$a_{i+1}=a_i-\alpha\frac{\partial J(a_i)}{\partial a}$$ avec \(\alpha\) le learning rate